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^^Procedimento per la compressione di codici, 
relative slstema e prodotto inf ormaticC 

* * * 

Campo dell ^ invenzione 
5 La presente invenzione si riferisce alle tecniche 

per la compressione di codici - 

L' invenzione e stata sviluppata con particolare 
attenzione alia possibile applicazione ai sistemi di 
tipo embedded. II riferimento a tale possibile 
10 applicazione non deve essere in aicun modo interpretato 
come limitativo della portata dell ' invenzione, che d 
af f atto generale . 

Descrizione della tecnica nota 

Nell ' implementazione dei processor!, ed in 
15 particolare dei processor! per sistemi embedded, e 
necessario tenere in conto diverse limitazioni: fra 
queste, le limitazioni principal! sono date da! costi, 
dall' assorbimento di potenza e dall'area di silicio 
occupata . 

20 Le limitazioni in termini di costo sono dettate 

• dalla volonta di utilizzare tali processor! come 
dispositivi di controllo in sistemi digital! di tipo 
consumer (ad esempio per applicazioni tipo smart card) 
dove ad elevati volumi di produzione si devono 

25 accompagnare bass! cost! per unitS. prodotta. 

L'aspetto dell' assorbimento di potenza sta 
diventando sempre piu importante, anche in 
considerazione dell ' applicazione d! tali processor! a 
dispositivi qual! telefonic! cellular!, cosiddetti 

30 portable digital assistant o PDA, ecc, dove e 
importante prolungare quanto piu possibile la durata 
della carica delle batterie. 

Per quanto riguarda I'area di silicio occupata - o 
in generale la dimensione del chip (die size) - se si 

35 pensa in particolare ad applicazioni del tipo smart 
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card risulta evidente che ^ imperative dare origine a 
piccole aree di occupazione. 

Dall'altra parte, le applicazioni oggi correnti 
richiedono un livello sempre piu elevato di 
5 flessibilita per essere in grado di soddisfare a tutte 
le esigenze funzionali richieste. Questo fatto fa si 
che sia necessario caricare nelle memorie del sistema, 
per eseguirli sul relative processore (ad esempio DSP o 
CPU) porzioni di codice software sempre piil rilevanti; 
10 fatto, questo, che si traduce nella tendenza ad 
utilizzare memorie costose e suscettibili di assorbire 
livelli rilevanti di potenza. 

Sussiste quindi I'esigenza di fornire soluzioni 
per ridurre le dimension! della memoria di prograrama di 
15 un dispositive del tipo sopra descritto. 

Una soluzione di questo tipo d quella nota con il 
nome commerciale di IBM CodePack<™^ Al riguardo si pud 
• utilmente consultare il relative manuale d'uso 
denominate IBM CodePacJc*™' Power PC Code Compression 
20 Utility, User's manual version 4.1. 

L'algoritmo in questiene e state messo a punto con 
il fine principale di migliorare le prestazioni del 
nucleo o core PowerPC. L' architettura del core in 
quest ione, pregettata come una tipica architettura RISC 
25 (Reduced Instruction Set Computer) , incorpera 
istruzioni di lunghezza fissa per semplificare il 
pregetto di processori con prestazioni elevate. Quasi 
sempre, le istruzioni di lunghezza fissa femisceno una 
density di codice inferiore rispetto ad un pregetto di 
3 0 tipo CISC (Complete Instruction Set Computer) , ma per 
la maggior parte delle applicazioni di tipo embedded, 
per cui il coste d un fattore molto significative, la 
density di codice e un parametro di progetto 
import ante . 
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Lo schema di compressione adottato nella soluzione 
IBM in quest ione ^ basato sull'osservazione del fat to 
che le istruzioni PowerPC utilizzate nelle applicazioni 
reali non sono distribuite in modo uniforme su tutti i 
5 32 bit utilizzati per rappresentata una singola 
istruzione. Talune conf igurazioni o pattern di 
istruzioni appaiono con frequenza molto maggiore 
rispetto ad altre. Dal punto di vista concettuale, 
queste istruzioni possono essere rappresentate tramite 

10 speciali sequenze di bit, piu corte rispetto alle 
istruzioni originali, e sostituite con le istruzioni 
originali dal controllore di decompress ione quando le 
istruzioni vengono portate nel core del processore. 

E' possibile pensare a diverse variant i di questo 

15 schema di base. Un perf ezionamento che si dimostra 
efficace nel caso delle istruzioni PowerPC su 32 bit e 
quello di comprimere separatamente i 16 bit in 
posizione ^*alta" ed i 16 bit in posizione ^'bassa" dei 
32 bit che compongono 1 ' istruzione . 

20 Per aumentare la density del codice, le istruzioni 

utilizzate in modo piCl comune devono essere sostituite 
da sequenze di bit piu piccole, destinate ad essere 
espanse successivamente dal controllore di 
decompressione cosi da ricostituire le istruzioni 

25 origlnarie PowerPC. Per massimizzare la density di 
istruzioni si impiegano sequenze con una lunghezza 
variabile, in termini di numero di bit, collocate in 
memoria in condizioni '"end-to-end" . Il software di 
compressione tratta I'immagine del codice non-compresso 

30 un' istruzione per volta, esaminando I'istruzione cosi 
da identificare corrispondenze (match) nell'ambito del 
contenuto della tavola di decodifica. 

Come gicl si e detto, questa tecnica nota viene 
applicata separatamente ai 16 bit in posizione "alta" 

35 ed ai sedici bit '^bassa" nell'ambito dell ' istruzione , e 
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gli n valori alti piu frequenti sono in generale 
diversi rispetto agli n valori ^^bassi" piu frequenti. 

Nell'ambito della soluzione nota qui considerata 
si riscontra per6 che, tanto con riferimento ai bit 
5 "^alti" quanto con riferimento ai bit "^bassi", se si 
riscontra una stringa di 16 bit tale da non ricorrere 
in modo suf f icientemente frequente da ricevere una 
specif ica posizione (slot) nell'anibito della tabella, 
la stringa di bit in questione deve essere riprodotta 
10 in formato ^^letterale" su 16 bit. Cio richiede 
I'aggiunta di tre bit (di solito "111") per 
identificare appunto tale stringa come una stringa di 
bit che non puo essere compressa. 

Si determina quindi una situazione - abbastanza 
15 incongruente - per cui 1 ' applicazione di un meccanismo 
destinato ad attuare una compressione fa si che per 
rappresentare i 16 bit original i se ne debbano usare 
ben 19 ♦ La situazione e resa ancora piu incongruente 
quando le condizioni di non-comprimibilita considerate 
in precedenza si manifestano tanto per i 16 bit ''alti" 
quanto per i 16 bit ^^bassi" che compongono 
un' istruzione . Questa istruzione , originariamente 
comprendente 32 bit finisce infatti per essere 
rappresentata con 38 bit. Di conseguenza 1' istruzione 
25 "compressa'' non risulta affatto tale in quanto 
comprende ben sei bit in piu rispetto all ' istruzione 
originaria. 

II formato di memorizzazione dell ' istruzione 
compressa prevede, nell'ordine, i tag (essenzialmente i 

30 campi che identificano il tipo di istruzione e le 
modality utilizzate per la compressione rispettivamente 
per i bit "alti" e per i bit "bassi") e poi i valori di 
indice - ossia, in prat ica, la rappresentazione in 
forma compressa (anche qui, nell'ordine, per i bit 

35 "alti" e per i bit "bassi"). 



20 
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Se tutte le istruzioni compresse sono destinate ad 
essere seguite in sequenza, questo schema di codiflca 
relativamente semplice risulta soddisf acente . Il 
controllore di decompress ione viene infatti 
5 semplicemente puntato all'inizio dell ' immagine 
dell' istruz ione compressa per poi andare a recuperare 
(fetch) e decomprimere il flusso dell ' istruzione cosi 
come richiesto dal processore. 

Tuttavia, esistono flussi di istruzioni di 
10 applicazione che contengono un numero signif icativo di 
ramif icazioni . 

Questi flussi richiedono al controllore di 
decompressione di localizzare I'inizio delle istruzioni 
compresse in qualunque luogo della regione di 
15 indirizzamento rappresentata dall ' immagine di 

istruzione compressione rendono piu critico il 
funzionamento di questo schema. 

Infatti, per riuscire a localizzare I'inizio di 
una qualunque istruzione, e necessario disporre di un 
20 meccanismo in grado di tradurre I'indirizzo 
dell ' istruzione desiderata in un- indirizzo- che - piinta 
verso I'inizio della corrispondente istruzione 
complessa. 

Lo schema utilizzato nella soluzione nota cui si 
25 sta qui facendo riferimento prevede di suddividere le 
istruzioni in gruppi e di fornire un meccanismo in 
grado di localizzare I'inizio del gruppo che contiene 
1' istruzione desiderata. 

II gruppo e successivamente trattato dal 
30 meccanismo di decodifica fino a quando si raggiunge 
1' istruzione desiderata. Questo meccanismo richiede 
per6 un meccanismo di indirizzamento implementato 
tramite una tabella di indici, chiamata di solito 
address translation table (ATT) , owerosia tabella di 
35 traduzione degli indirizzi . 
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Scopi e sintesi della presente invenzione 
La presente invenzione si prefigge lo scopo di 
fornire una soluzione di compressione in grado di 
superare gli inconvenienti delineati in precedenza. 

Secondo la presente invenzione, tale scopo viene 
raggiunto grazie ad un procedimento avente le 
caratteristiche richiamate in modo specif ico nelle 
rivendicazioni che seguono. L' invenzione riguarda anche 
il relative sistema nonch€ il corrispondente prodotto 
informatico direttamente caricabile nella memoria di un 
processore digitale e contenente porzioni di codice 
software suscettibili di attuare il procedimento 
secondo 1' invenzione quando il prodotto viene eseguito 
15 su un processore digitale. 

La soluzione secondo 1' invenzione off re una 
tecnica di compressione suscettibile di operare 
direttamente sul codice binario generate dal 
compilatore per comprimerlo e generare un nuovo file 
20 binario le cui dimensioni risultano circa del 40% 
inferiori rispetto alle dimensioni del file, originario. 

Tale file compress© d quindi suscettibile di 
essere caricato nella memoria di programma del 
processore . 

25 II decodificatore d suscettibile di essere 

realizzato di preferenza sotto forma di un piccolo ASIC 
suscettibile di essere collocate fra il bus di sistema 
e la memoria cache di istruzioni (ad esempio nell'unit^ 
di controllo di memoria o MCU o, se e presente una 
gerarchia di cache con almeno due livelli di cache, fra 
il primo ed il secondo livello, cosi da mascherare 
meglio la sua latenza) , owero ancora direttamente al 
terminale di uscita della memoria esterna. 
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Breve descrizione dei disegni annessi 
L'invenzione sara ora descritta, a puro titolo di 

esempio non limitative, con riferimento ai disegni 

annessi, nei quali: 
5 - le Figure 1 e 2 illustrano la costruzione dei 

vocabolari e la gerarchia dei dati utilizzabili in una 

soluzione secondo 1 ' invenzione, 

- le Figure 3 a 7 comprendono vari diagrammi utili 
per comprendere il meccanismo posto alia base della 

10 soluzione secondo 1' invenzione, 

- le Figure 8 e 9 illustrano vari schemi di 
organizzazione dei flussi di dati in una soluzione 
secondo 1 ' invenzione , 

- la Figura 10 e una prima rappresentazione del 
15 processo di compressione dei dati in una soluzione 

secondo 1 ' invenzione , 

le Figure 11 a 13 rappresentano, in modo 
complementare , il processo di decodifica, 

- le Figure 14 a 16 rappresentano varie possibili 
20 implement a zioni del meccanismo di decodifica delle 

parole codificate, e 

- le Figure 17 e 18 rappresentano, sot to forma di 
schema a blocchi funzionali, due architetture di 
elaborazione suscettibili di utilizzare la soluzione 

25 secondo 1 ' invenzione • 

Descrizione particolareggiata di esempi di 
attuazione della soluzione secondo 1^ invenzione 

Con riferimento alio schema della figura 1, si 
considera di partire da una sequenza non~compressa di N 

3 0 istruzioni (da 0 a N-1) che formano un programma 
originario OP destinato ad essere eseguito da un 
processore, cosi come scritto dal compilatore. Ciascuna 
istruzione si suppone essere lunga n bit (dove n d un 
multiple di due) . 
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E' allora possibile pensare di suddividere il 
flusso o stream di dati in ingresso in d flussi diversi 
di sot to- istruzioni ottenuti dal flusso originale 
prendendo da esso d parti diverse. La somma di d sotto- 
istruzioni omologhe (che appartengono alia stessa 
istruzione originaria non compressa su n bit) ^ pari a 
n (con ni+n2+..+nk+..ji„=n) , dove rappresenta il nutnero 
di bit compresi nella k-esima sotto- istruzione . 

Nel seguito si considerer^ per semplicita il caso 
in cui n d pari a 32 bit, tn d pari a 2 e ni=n2 d uguale 
a 16 bit, cosicche nell'ambito della singola istruzione 
sono distinguibili una porzione ^'alta" (high) ed una 
porzione «bassa" (low) e che le due parti "alta" e 
"bassa" comprendano ciascuna lo stesso numero di bit, 
15 ad esempio 16 bit nel case in cui il numero n di bit 
compreso in ciascuna istruzione sia pari a 32. 

apprezzerS che la scelta di tali specif ici 
valori, ed in. particolare la partizione della singola 
istruzione in due porzioni identiche fra loro, non ^ in 
20 alcun modo iraperativa ai fini dell ' attuazione 
dell'invenzione dal moment© che quanto detto- nel 
seguito con riferimento a guesto caso specifico (citato 
in via principale per semplicita di illustrazione) si 
applica ad una partizione qualsiasi . 
25 Sulla base di considerazioni statistiche e 

possibile rilevare che la density di probabilita delle 
occorrenze di ciascuna semi -istruzione segue una curva 
laplaciana. Per questo motivo, e possibile calcolare 
due diversi vocabolari che contengono le M istruzioni 
pia frequenti per ciascuna meta del flusso originario 
di istruzioni. 

Naturalmente, queste M istruzioni (dove M g molto 
piu piccolo di N) non sono tali da coprire I'insieme 
totale delle istruzioni di programma. Di conseguenza d 
necessario riservare una delle M parole disponibili in 
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ciascun dizionario o vocabolario come via di fuga o 
^^escape" ed associare a questa particolare parola una 
probabilita di occorrenza pari alia somma delle 
occorrenze di tutte le parole che non appartengono agli 
5 insiemi del vocabolario e poi riordinare nuovamente 
tutte le parole, trattando la parola denominata 
*^escape" come le altre. 

Si pu6 not are che un buon candidate per M d un 
multiplo di 2 (ad esempio si pud prendere M=2^^-l=l023 , 

10 dove M-l=1022 sono le parole reali, ed una d la parola 
che funge da escape) . 

Nello schema della figura 1, il riferimento CD 
rappresenta i vocabolari completi format! secondo i 
criteri descritti in precedenza e comprendenti 

15 rispettivamente H e V parole per le porzioni ^^alta" e 
^^bassa" . Inf ine, il riferimento FD indica i vocabolari 
finali, comprendenti M parole, anch'essi suddivisi in 
una parte ^'alta" ed in una parte ^^bassa" , con la 
rappresentazione della parola di escape in entrambi i 

20 casi . 

Una volta identificati i vocabolari, come 
descritto in precedenza, risulta possibile sostitu'ire 
ciascuna semi-istmazione del codice con il 
corrispondente indice da 0 a M-2, se presente, o con il 
25 codice di escape seguito dalla semi -parola originaria. 
Naturalmente la larghezza dell' indice, espressa in bit 
ed indicata con b, deve soddisfare la seguente 
equazione : 

b = log2(M+l) 

30 Nell 'esempio indicate in precedenza, con M pari a 

1023, b e pari a 10 bit. 

A questo punto, cosi come illustrate nella figura 
5, la sequenza degli indici e raggruppata in un gruppo 
di vet tori GV aventi dimensioni (espresse in termini di 
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istruzioni per vettore) pari alia dimensione della line 
cache del processore . 

Ciascun gruppo di vettori GV d a sua volta 
suddiviso in B vettori che rappresentano il livello piCi 
5 basso della gerarchia e contenenti ciascuna un numero 
di indici pari a nl, dove nl g dato dal rapporto 
CACHE_LINE/B fra la lunghezza della cache di linea del 
processore e B, dove B e nl sono potenze di due 
Cxascun vettore e codificato in modo indipendente dagli 
10 altri. ^ 

Alternativamente, per ciascun gruppo di vettori, 
alia fine del processo di codifica si calcola e si 
salva in una tabella, chiamata tabella di traduzione 
degli indirizzi (ATT), I'indirizzo di partenza su 32 
15 bzt del blocco compresso, oppure le differenze 
espresse in byte, rispetto all'ultimo indirizzo 
completo riportatovi. Tale tabella d poi caricata 
nella memoria interna del decodif icatore. Questa 
tabella permette una gestione efficiente dei salti 
present i nel codice, consentendo una rapida conversions 
degli indirizzi. 

Per codificare ciascun vettore, d necessario 
conoscere la norma degli indici contenuti all'interno 
Per norma si intends la grandezza definita come 

norma = ^(index) 

Hi 

Le dimensioni, in bit, della norma dipendono dalle 
dxmensioni dei vocabolari e in particolare ^ pari a 
nl+b bit. 

Continuando con I'esempio fatto in precedenza, in 
30 cux b e pari a 10 bit (M=1023) e scegliendo la 
dimensioni del vettore pari a quattro indici, la 
dxmensione massima, espressa in bit, della norma d pari 
a 12 bit (2^=4096 > 1023*4=4092) . 

Poichg questa componente del vettore codificato 
35 pud essere molto importante, un modo per ridurre la 
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quantita di bit necessari pu6 essere quella di 
utilizzare una codifica di lunghezza variabile 
(variable length coding o VLC) solo per la norma. Le 
tabelle di look-up della codifica VLC, diverse 
5 rispettivamente per la parte alta e la parte bassa del 
codice, possono essere determinate tramite diverse 
simulazioni su campioni (benchmark) diversi e rilevando 
la ricorrenza di ciascuna norma possibile al variare 
dei parametri dati dalla dimensione del vocabolario e 
10 da B. 

A partire da questi dati e possibile determinare 
la curva di distribuzione per ciascuna combinazione dei 
due parametri. Queste curve sono divisibili in nP parti 
con la stessa probabilita (vale a dire con la stessa 
15 area) con numeri elementi all 'interne di ciascuna area 
arrotondati a multiple di due piu vicino. 

A titolo di esempio, la figura 3 fa vedere un caso 
per M = 1023 e nl = 4. La curva rappresenta la 
distribuzione statistica della norma per la parte alta 
20 del codice su un ampio insieme di campioni di prova. Le 
due linee verticali esprimono la divisione della curya 
in tre parti con la stessa probabilita in 
corrispondenza di valori di norma pari rispettivamente 
a 64 e 320. 

25 In quest o esempio, i valori di norma compresi fra 

0 e 64 sono codificati con un primo bit di etichetta 
(0, ad esempio) e sei bit che rappresentano un valore 
reale. I successivi 256 valori sono rappresentati con 
due bit di etichetta (10, per esempio) e otto bit per 

30 il valore, ed infine gli altri 3772 valori (possibili, 
ma poco probabili) con due bit di etichetta (11, per 
esempio) e dodici bit per i valori. 

Facendo ricorso alia distribuzione statistica 
laplaciana degli indici dei vocabolari e possibile 

35 definire come L il numero di indici successivi 
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codificati insieme come parola di codice unica (sempre 
una potenza di due, fra 1 e 32) ed una tabella di look- 
up, chiamata nel seguito anche N_table, con dimensioni 
parx a [L, K] , dove L ^ pari alle parole che verranno 
concatenate insieme e K g la massima norma possibile 
(somma dei . valori assoluti) per le parole codificate 
destinata ad essere pre-calcolata cosi come meglio 
descritto nel seguito, aenza che ci sia per6 una 
dipendenza dai dati di ingresso. 

La parola codificata ottenuta partendo dagli L 
successivi indici su 16 bit, qui denotninata encoded, d 
calcolata nel modo seguente: 

L X 

encoded = J] 

«=i y=i 

dove la prima sommatoria si estende per i che va 
15 da 1 a L e la seconda sommatoria si estende per j che 
va da- 1 a Xi. 

Di conseguenza, il numero di somme necessarie per 
codificare L indici d pari a L*max(xj) . 

Se si ritorna all'esempio visto in precedenza, e 
20 supponendo -che- L sia pari a 4, il numero -massimo di 
somme necessarie per ottenere una parola codificata ^ 
pari a 4*1023=4092. 

Inoltre, per un valore di norma dato S possibile 
predeterminare il numero di bit necessari per la parola 
25 codificata contando il numero di bit necessari 
utilizzando la seguente eguazione : 
bit = count (Nfcable [L+1. nozTna] ) 

dove "count" ^ una funzione che conta il numero di 
bxt richiesti dal suo parametro di ingresso. Questa 
funzxone § implementabile ad esempio con il seguente 
pseudocodice : 

ui32_t count (ui32_t input_number) 
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quantizzatore vettoriale piramidale introdotto da 
Thomas Fischer nell ' articolo ^^A Pyramid Vector 
Quantizer" apparso su ''IEEE Transactions on Information 
Theory", vol. IT-32, 4 luglio 1986, 

Nell ' articolo in questione d descritto ed 
illustrate un procedimento per sfruttare le proprieta 
di una sequenza di variabili indipendenti con una 
distribuzione laplaciana . 

Def inendo un vet tore di 

variabili casuali xi (gli indici di vocabolario, in 
questo caso) la densita di probabilita: 

fx (a) = I e-^^ 

con valore medio nullo e varianza 

Kj^ = 2/^2 

la densita di probability. delle Xi risulta 
nell' insieme 

fx(a) = n fx(ai) = (4)'' e-^^ 

dove la moltiplicatoria si estende per i che va da 
1 a e r rappresenta la .noinna del vettore X . 

r = ± Ixil = llxllx 

II parametro r specif ica un contorno con densita 
di probabilita costante. Per una sorgente laplaciana la 
media risulta pari a 

E[r] =4 

per cui e possibile definire una piramide nel modo 
seguente 

S(L,Q) = Wx e 91^: ^ l^il = I'xIU = qI^ 

1=1 

La variabile casuale r pu6 essere considerata come 
il parametro che rappresenta la superficie di una 
particolare piramide S(Ii^r). 
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Ui32_t bits; 

for (bits=i ; ;bits+++) 

if ( (input»=i) ==0) 
return bits; 



Quando uno o oiii r-nri-ir--; 

^ coaici di escape sono s^^^^^ 

10 coai.ica.i in una .ingola parola di. cCicer 

.trea. uscita dcpo di es.a g collocata la pa^ll 

originaria su 16 bit non compressa. 

Di ccnseguenza. ii jormato dell ' i.truzione 
cc^ra..a risulta eae.r. ^elia illustrate nella flgu" 
15 4 dove compaiono nell'ordine: 

- I'etichetta (tag) di norma «alta" (HNT) , 
•"•' ^^^^^^^tta di norma "bassa" (LNT) , 
I'indice di norma "alta" (HNI) , 
I'indice di norma «bassa" (LMI) , 

^0 - gli indici L "alti" (HLI) , 

- le parole di escape *alte" (HESCW)-, -- 

- gli indici L «bassi" (LLI) , e 

le parole di escape «basse" (Lbscw) 
Ritornando a parlare della tabella N table 
5 cons.derata in precedenea, si . notato che l. 

stessa ha una matrice di dimensioni fL, K] , dove L . il 
numero dx parole concatenate in una parola di codice e 
K al valore massimo disponibile per la norma 

dxpendente tanto dalle dimensioni dei vocabolari ZZto 
) dalla parola concatenata. 

Sempre facendo riferimento ad un esempio, se L e 
par. a 4 ed i vocabolari sono compost! da 1024 parole 
la d^menszone di N_table # pari a [1023*4] 

in questo contesto di distribuzione statistica 
laplaciana d utile f^-^ -y-i 4^ ■ «^-Lscxca 
uciie far raferimento al concetto di 
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Naturalmente, qualunque tipo di soluzione 
utilizzata per comprimere la memoria di programma di 
qualunque tipo di processore o DSP deve essere di tipo 
senza perdite o lossless. Deve quindi essere- possibile 
5 recuperare tutte le istruzioni originarie, senza 
perdite di inf ormazione : in case contrario, il relativo 
programma non pu6 operare in modo corretto. 

Questa limitazione piuttosto severa, suscettibile 
di essere allentata nel case della compressione di 
10 dati, implica che in linea di principio la soluzione 
pu6 generare piu bit rispetto a quelli necessari nella 
parola ^^non compressa" • 

Naturalmente questo non d accettabile in termini 
generali, cio vale ancora di piu se si pensa a come il 
15 processore recupera le istruzioni dalla memoria di 
programma. Normalmente, nella funzione di fetch il 
processore ricupera un' inter a linea di cache di 
istruzioni in xin colpo solo: come esempio si immagini 
una cache di riga lunga 16 istruzioni a 32 bit, il che 
20 significa 64 byte. 

Il caso pu6 essere naturalmente esteso a qpaalunque 
dimensione di linea di cache. 

La soluzione implementata tiene conto di questo 
fatto, cercando di comprimere un gruppo di vettori di 
25 istruzioni in una fase di pre-analisi e andando a 
verificare quanti bit sono necessari. Se i bit generati 
sono piu di quelli nella condizione non-compressa, e 
previsto che vengano copiate semplicemente le 16 
istruzioni, cosi come sono. Solo in caso contrario 
30 viene utilizzato il procedimento di compressione. 

Per una migliore comprensione di quanto detto nel 
seguito puo essere utile far dapprima riferimento alia 
fase di decompressione, tenendo conto che una delle 
principali caratteristiche richieste per la 
3 5 decompressione del codice d quella di essere in grado 
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Definendo quindi N_table (L,K) come il numero di 
punti interi appartenenti alia superficie s (L K) si 
vede Che, ad esempio, nella situazione rappresentata 
nella figura 5, i punti interi sulla superficie della 
B piramide S(3,4) sono illustrati con riferimento ad una 
piramxde con L=3 dimensioni con norma K=4 . A questa 
piramide appartengono soltanto i punti interi la cui 
soituna di coordinate (in valore assoluto) g pari a 4 

La costruzione della tabella deve soddisfare 
all ' equazione 

N(i,j) = 2 Z N(i-l,j)+N(i,j-l) 

.=1 /=i 

dove la prima sommatoria si estende per i che va 
da 1 a L e la seconda sommatoria si estende per j che 
va a K. Per L pari a 4 e dimensioni di vocabolario ^ 
parx a 1023 si ottiene la superficie rappresentata 
nella figura 6 • 

in questa situazione si permette a ciascun valore 
Xi (I'xndice di vocabolario nella parola concatenata da 
codificare) di essere compreso fra 0 e L volte la 
dimensione del vocabolario, Questo non ^ per6 un - dato ■ 
realxstico per cui ^ pi(i corretto prevedere che ciascun 
possa variare soltanto f ra 0 e la dimensione del 
vocabolario (def inita nel seguito D) . 

L' equazione vista in precedenza si modifica in 
modo conseguente nel modo qui sotto riportato 

L K max(DJ) 

""^^'^^ = S Z S N(i,j)H-N(i-l,j-q) 

dove le tre sommatorie si estendono, nell'ordine 
per i che va da i a L, j che va da i a K e q che va da 
0 a max(D, j) . 

In questo caso, per L pari a 4 e dimensioni di 
vocabolario pari a 1023 si ottiene la superficie di 
tabella di norma ridotta rappresentata nella figura 7 
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codificata che rappresenta le n istruzioni formanti un 
vettore compresso. 

Passando, con specifico riferimento alle figure 8 
e 9 all ' illustrazione dettagliata dell ' organizzazione 
5 del flusso si pud - sempre a titolo di esempio - 
supporre di operare in una condizione in cui : 

la "profondita" dei vocabolari ^ pari a 2 
vocabolari, ciascuno con profonditS. di 16 bit, 

- la dimensione massima del vocabolario e pari a 
10 1023 parole, compreso il codice di escape, 

- il numero di parole concatenate che formano un 
vettore e pari a 4 . 

In quests condizioni, la norma massima teorica che 
sarebbe possibile avere per una parola codificata (un 

15 semivettore, cosi come gia evidenziato in precedenza) e 
1023*4=4092. Lo scopo e quelle di ridurlo ad un valore 
infer lore rispetto a 31. 

Invece di codificare tale norma tramite una 
codifica VLC, come pre cedent emente ipotizzato, questo 

20 obiettivo pu6 essere conseguito facendo avanzare nel 

flusso di bit 11 bit meno significative di ciascuna 

parola che compone la parola di codifica e effettuando 
poi una divisione per un fattore 2 (il che equivale ad 
uno shift verso destra dei bit) , continuando poi in 

25 modo ricorsivo fino a quando la norma § infer lore a 32 
(in questo caso essa pud essere sempre codificata con 5 
bit) . 

Ad esempio, supponendo di avere una parola da 
codificare con i seguenti indici \l5, 34, 18, 43 J' con 
30 norma W=15+34+18+43=110 e possibile procedere nel modo 
seguente 

^15, 34, 18, 43^ W=110 

^7, 17, 9, 2lL- forw=U, 0, 0, l}; W= (110-2) /2-54 
^3, 8, 4, loK- forw=^l, 1, 1, 1^- W= (54-4) /2=25 
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di accedere a qualunque istruzione del codice, seguente 
il flusso di istruzioni richieste dal programma che 
vxene eseguito. Questo flusso e, in generale, diverse 
rispetto alia sequenza statica delle istruzioni 
5 generate dal compilatore. Questo per la presenza di 
salti, loop e chiamate di f unzioni . 

L'adozione della tabella di traduzione degli 
indirizzi ATT citata in precedenza consents di mappare 
I'indirizzo di un' istruzione non cotnpressa nel codice 
10 compresso cosi da poter decomprimere qualunque 
istruzxone del programma senza dover di necessita 
decomprimere tutte le istruzioni precedenti. 

m sostanza, la soluzione secondo I'invenzione si 
basa su una gerarchia dei dati finali riassumibile nei 
15 termini seguenti: 
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Gruppo di 


compressione |^ ^acroblocchi consecutivi 

[(compresso) 


Gruppo di 


vettori 


R blocchi consecutivi 

R = dimensione riga di cache / L 

(compresso) 


Vet tore 


< 


L istruzioni consecutive su 16 bit 
con L pari al divisore intero 
della dimensione della riga di cache 
(compresso) 


Istruzione 


1 


singola istruzione su 16 bit 
(non compresso) 



Sulla base del meccanismo descritto in precedenza 
SI e cosi creata una particolare struttura del flusso 
compresso dove, sostanzialmente, si e perseguito lo 
scopo di ridurre la dimensione della norma della parola 
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bit ed il processo di decodifica della parola 
codif icata . 

In questa soluzione alternativa, corrispondente ad 
un'organizzazione ottimale dello stream, cosi come 
5 rappresentata nella figura 9, S prevista, nell'ordine, 
la collocazione delle stringhe di bit, corrispondenti , 
rispettivamente, alle grandezza SS, N, EW e SB viste in 
precedenza . 

Questa composizione dello stream, che non 
10 influenza il fat tore di compress ione, semplifica 
notevolmente il processo di decompressione • 

Nel caso migliore, si utilizzano infatti solo 8 
bit per ciascun semivettore, tenuto tale di 8 byte per 
gruppo di vet tori (16 istruzioni) . Al contrario nel 
15 caso peggiore (peraltro molto raro) si utilizzano 
(3+7*4+5+13) *2*4=140 bit ossia 17,5 byte. 

Se necessario, si aggiungono le parole di escape 
su 16 bit- In questo caso si aggiungono 16*16*2 bit 
ossia 64 byte per un totale 64+17,5=81,5 byte. 
2 0 In ogni caso, questo caso pu6 essere evitato dalla 

pre-analisi, ' per cui soltanto i 64 byte -original! 
vengono codif icati . 

Si noti ancora che non 6 necessario che il codice 
di escape venga associate all'indice piii grande nel 
25 vocabolario. In generale questo pud essere vero per la 
parte *^alta" su 16 bit nelle istruzioni non compresse, 
poiche questa parte contiene I'operando e il codice 
operativo e la loro variabilita non e molto alta. 

Al contrario, con la parte di 16 bit piu bassa 
30 delle istruzioni la situazione puo essere molto diversa 
(fatto dimostrato nella pratica) , poiche ci sono gli 
operandi delle istruzioni e cosi la loro variabilita 
risulta pi\l elevata facendo si che (in funzione della 
ricorrenza) I'indice associate possa essere piu basso. 
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cosi da raggiungere il risultato con due shift 
verso destra (S) . 

Nella formula sopra riportata con forw si sono 
indicati gli insiemi di bit che rappresntano i resti da 
5 aggiungere in fase di decodifica e che vanno inseriti 
(forwarded) all' interne dello stream compresso. 

Si pud notare che nel caso peggiore (Uo23, 1023 
1023, 1023 W=4092) il numero complessivo di shift d 
pari a 7, con una norma residua pari a 28 e la parola 
10 da codificare \i , 1, 1, n\ , per cui il numero di shift 
da realizzare pud essere sempre codificato con 3 bit. 
La figura 8 rappresenta lo stream di bit per un 
semivettore, cosi come rappresentato comprende quindi : 

- 3 bit indicativi degli shift eff ettuati (SS) , 

- il numero di bit shiftati (SB) pLri 
nell'esempio qui illustrate, a 4 bit per 2 shift 
complessivi, 

- la norma (N) , rappresentata su 5 bit , e 

- la parola codificata (EW) . 

Peraltro, quello illustrate nella figura 8 pu6 non 
essere il modo migliore per raccdgliere i" numeri nello 
stream compresso pensando alia funzione del 
decodif icatore . 

Invece di prevedere ad esempio S campi di 4 bit 
25 che indicano i resti, shift dopo shift, e possibile 
mettere direttamente il totale dei 4 resti, di S bit 
ciascuno, considerando il fatto che si divide sempre 
per 2 . 

Cosi, con riferimento all 'esempio visto in 
precedenza, d possibile porre \\. 0, 0, ll'*2+U 1 1 
1M3, 1, 1, ' ' . 

inoltre, i s*4 bit relativi ai resti delle 
divisioni possono essere vantaggiosamente collocati 
alia fine dello stream. Questo consents al 
decodificatore una migliore lettura dei resti su S*4 
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35 
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esterna I'esatto gruppo di vettori compressi tenendo 
conto delle esigenze del processore* 

Si supponga in parti col are che il program counter 
(PC) del processore richieda una riga di istruzioni che 
5 non e gia presents nella rispettiva cache di istruzioni 
(1$) . 

Dividendo questo valore per la dimensione della 
linea di cache (16, negli esempi fatti in precedenza) 
il de-comp res sore identifica qual e il gruppo di 

10 vettori in cui d presente I'istruzione richiesta. 
Dividendolo ancora per 2 ottiene anche il gruppo di 
compressione con il relative indirizzo della tabella 
ATT, Se il numero del gruppo di vettori e pari, dovra 
leggere soltanto una voce di 26 bit nella tabella ATT. 

15 Altrimenti dovra anche aggiungere 1' offset di 6 bit 
cosi da ottenere 1' indirizzo del gruppo di vettori 
compresso nella memoria principale. 

A questo punto pu6 prelevare il gruppo di vettori 
compresso e cominciare con la decompress ione vera e 

20 propria. In primo luogo dovra leggere i primi 3 bit 
_ - (-bit S& -delle - f igure 8 - e 9) per capire quanti shif t 
sono stati fatti. A partire da questo numero leggera i 
campi di S bit ciascuno (Rl, R2, R3 e R4) , ossia 
1 ' inf ormazione indicata con SB nelle figure 8 e 9, che 

25 rappresentano il resto da aggiungere alia parola 
decodificata nonche i 5 bit aggiuntivi che 
rappresentano la norma (campo N delle figure 8 e 9) . A 
questo punto esso pu6 leggere i bit rimanenti rilevati 
al vettore corrente, ossia la parola codificata vera e 

30 propria che puo essere compressa con uno dei tre 
algoritmi che verranno descritti nel seguitO/ ottenendo 
quattro piccoli indici. 

Per ottenere nuovamente i quattro indici effettivi 
dovra shiftare S volte a sinistra (operazione 
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Lo schema della figura 10 riproduce, in termini 
affatto general!, uno schema di compressione realizzato 
secondo 1 ' invenzione . 

A partire da un passo iniziale, indicate con loo 
5 in cui la funzione count che abbiamo visto in 
precedenza viene posta a O, in una fase o passo di 
confronto 102 si verifica se il parametro W gia 
xntrodotto in precedenza sia minore di un valore 
prede terminate, quale ad esempio 32. 
10 ^ in case negative (cosa che awiene normalmente 
all'xnizio dell'applicazione), in una aequenza di passi 
indicate con 104, 106, 108 e 110 si realizzane le 
operazioni descritte in precedenza, essia, previe 
mcremento della funzione count (passo 104) si 
introduce nelle stream il bit meno significative di 
ciascuna parela (passo 106), effettuando guindi la 
divisiene per 2 (passe 108), calcolande quindi la norma 
(passe 110) precedende in mode iterative fine a quande 
la stessa ^ mene del valore pari a 32 utilizzato nel 
passe di confronto indicate con . 102 . Completate il 
precesse iterative descritte in precedenza, -il passe 
102 da esite positive pertande all ' emissiene del 
risultato m un passe indicate con 112. 

Fatte le suddette censiderazieni generali riguardo 
25 al precesse di compressione, ancora una volta pu6 
essere utile, per procedere maggiormente nel dettaglio 
affrentare dapprima I'aspetto del processo dl 
decompressione . 

Queste sarS fatte facendo riferimente a tre 
30 diverse pessibili implementazieni del nuclee del 
decodificatere, che si dif ferenziane una dall'altra per 
le prestazieni in termini di velocity e di esigenze in 
termini di onere computazionale/memoria . 

In generale, un decompressere eperante secende la 
presente invenzione deve peter recuperare dalla memeria 
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In sostanza, i passi indicati con 142 e 144 
corrispondono al recupero del gruppo di vettori 
compressi, alia lettura dell ' inf ormazione inerente al 
numero degli shift effettuati e alia lettura 
5 dell ' inf ormazione relativa alia norma. A partire da 
quest a inf ormazione, nel passo indicato con 14 6 vengono 
quattro campi Rl, R2, R3, R4 destinati ad essere 
aggiunti alia parola decodificata (letta nel passo 148 
e decodificata nel passo 150 cosi da generare gli 

10 indici il, i2, 13 e i4 , 

II passo indicato con 152 corrisponde 
all' ef f ettuazione degli shift in funzione 

dell ' inf ormazione letta nel passo 142 ed il nodo 
indicato con 154 corrisponde all ' operazione di somma 

15 che porta alia generazione degli indici il, 12, 13, 14 . 
prima di pervenire ad xm passo di stop 156, 

La terza fase del processo di decodifica, 
rappresentata nella figura 13, corrisponde alia 
codifica vera e propria. 

20 Dal punto di vista concettuale essa corrisponde 

- all'opposto dell'algoritmo di compressione descritto in: 
precedenza con riferimento alia costruzione della 
tabella N nel caso in cui i parametri L e K sono, 
rispettivamente, pari a 4 e 31, cosi da ottenere una 

25 matrice di dimension! [4, 31] . 

Partendo dalla parola codificata di ingresso, 
passo 150 e dal suo valore di norma si precede 
all ' inserimento nell' ultima riga della matrice N nella 
colonna indicata dalla norma. 

30 II valore letto nella matrice e il valore di 

ingresso vengono confrontati in un passo indicato con 
152 . 

Si possono verif icare due casi . 

Se il valore di ingresso e infer lore a quelle 
35 letto (esito positive del passo 152) si precede, in un 
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equivalence ad una moltiplicazione per 2=) i g^attro 
numerx e poi aggiungere i resti Ri, R2, R3, R4 

La figura ii rappresenta - con riferimento al 
ixvello pxu elevate - ii processo di decompress ione 

in sostanza il processo di decompressione prevede 
lo svolgxmento di tre ordini di passi o operazioni 

II prxmo g la rivelazione dell ' indirizzo del 
gruppo di vettori di partenza. 

10 . T "'^"^'""^^^ -11^ sequenza gia descritta in 
10 precedenza, il passo 120 indica la richiesta, da parte 

del program counter PC di una linea di istruzionf che 

non e presents nella cache istruzioni 

appuntoTa'i- ^ rappresentano 

appunto la dxvxs.one del valore in guestione per le 
15 dxmensxonx della riga di cache (is) e l-ulterior^ 
■ dxvxsxone per 2, rispettivamente . L'uscita del passo dx 
dxvxsxone- 124 corrisponde all'identificazione del 
9ruppo dx compressione che consente, in un passo 126, 
dx xndxrxzzare la tabella ATT. 
20 II passo indicate con 128 ^ .il passo in cui si 

verxfxca^se il numero identif icativo del: gruppo di 
vettori e pari. ^ 

^5 dx 26 bxt nella tabella ATT. 

II riferimento 134 ind-irt^ 4i 
della procedure. ""^""^ 

l-a figura 12 rappresenta invece la seconda fase 
del processo di decodifica, corrlspondente alia 
r.costru.io„e degli indici dei vocabolari di parten.a 
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un'ulteriore colonna (la sesta) oltre a quelle 
necessarie cosi da meglio chiarire il modo di 
procedere • 



L/K 


1 


2 


3 


4 


5 


6 


1 


0 


0 


0 


0 


0 


0 


2 


1 


1 


1 


1 


1 


1 


3 


1 


2 


3 


4 


5 


6 


4 


1 


3 


6 


10 


15 


21 



5 

La prima considerazione che si pu6 fare e data dal 
fatto che le prime due righe (costituite la prima tutta 
da zeri e la seconda tutte da uno) non sono necessarie. 

Queste righe possono quindi essere rimosse 
10 semplif icando la matrice, considerando altresi che le 
ultime due componenti da decodificare possono essere 
ottenute direttamente dal resto dell ' ingresso e dalla 
sua norma tramite differenza. 

Inoltre, le altre L meno due righe possono essere 
15 modificate, in modo che possano contenere direttamente 
le accumulazioni dei numeri ed esplodendole in funzione 
della norma di ingresso come indicate nella tabella che 
segue, dove le celle indicate con "BLANK" sono vuote e 
in realta non necessarie. 

20 





1 


2 


3 


4 


5 


6 


1 


1 


BLANK 


BLANK 


BLANK 


BLANK 


BLANK 


2 


2+1=3 


2 


BLANK 


BLANK 


BLANK 


BLANK 


3 


5+1=6 


3+2=5 


3 


BLANK 


BLANK 




4 


9+1=10 


7+2=9 


4+3=7 


4 


BLANK 


BLANK 


5 


14+1=15 


12+2=14 


9+3=12 


5+4=9 


5 


BLANK 


6 


20+1=21 


18+2=20 


15+3=18 


11+4=15 


6+5=11 


6 


1' 


1 


BLANK 


BLANK 


BLANK 


BLANK 


BLANK 


2' 


3+1=4 


3 


BLANK 


BLANK 


BLANK 


BLANK 
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passo indicate con 154 a sottrarre al primo valore dal 
secondo inviando in uscita, su una linea indicata con 
156, xl valore di indice decodif icato. Si procedere 
quindi, in un passo indicate con 158 a ridurre di uno 
il valore della norma. 

Qualora invece il passo 152 dia esito negative la 
dxfferenza fra la norma di partenza e quella effettiva 
e 1' ultimo degli l indici codificati, per cui il 
processe viene awiato passando, in un passo indicate 
con 160 dalla riga successiva della colenna Ik dove il 
precedente confront© ha dato esito negative. 

II passo indicate con 162 g semplicetnente un passe 
dx confronto legate alio svolgimento in mode ciclice 
della sequenza dei passi indicati con 152, 154, 158 In 
15 particelare, quando si verifica che 1' indice corrente 
C, xnizialmente pesto al valore L # arrivate al valore 
0, sx d semplicetnente verificato (esito positive del 
passo 162) Che il precedimento ^ state cempletato, per 
cux il sistema evolve verso un passe di step indicate 
20 con 164. 

La soluziene appena descritta puo essere 
ulteriormente perfezionata in termini di prestazioni 
sfruttando il parallelisme intrinsece dell ' algeritme di 

base . 

25 Queste pu6 awenire secondo le modality 

ulteriormente descritte nel seguito. 

In particolare, una possibile variante di 
implementaziene del processe di decompressiene ^ basata 
sulla considerazione che I'anello interne del processe 
30 vxsto in precedenza (passi 152 e 160) pu6 essere 
netevelmente ridetto in termini di iterazione 
esplodendo" la tabella N_table in piu righe ed 
esamxnandola con attenzione. 

La tabella qui setto riprodotta costituisce un 
■is esempio con L=4 p tt r^^-^s r- ^ 

n 4 e K parx a 5. E' stata aggiunta 
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essi, e I'altro altro non e che il rimanente dato di 
Ingres so . 

Questi ultimi due indici vengono emessi, invece 
che dal passo 172, dal passo 174, a partire dal quale 
5' il sistema evolve verso un passo finale d'arresto 
indicato con 176. 

La variante di implementazione rappresentata nella 
figura 15 e per molti versi ttiolto simile a quel la 
rappresentata nella figura 14. Per questo motivo passi 
10 identic! o equivalent! a quelli gia descritti in 
precedenza con riferimento alia figura 14 sono stati 
indicati con gli stessi riferitnenti nella figura 15. 

La differenza principale fra la soluzione 
illustrata nella figura 15 e la soluzione illustrata 
15 nella figura 14 sta nel fatto che nel passo 166' nella 
figura 15 il sistema sceglie la prima riga non-negativa 
procedendo da sinistra verso destra cosi da generare, 
oltre all' indicazione di posizione sfruttata nel passo 
172 per generare gli indici in uscita (eccezion fatta 
20 per gli ultimi due) anche il corrispondente valore che 

viene sfruttato nel passo 168. - _ ... 

Per fare questo, il banco o batteria di 
comparator! 164 illustrate nello schema della figura 14 
e sostituito nello schema della figura 15 da un blocco 
25 o batteria di sommatori 164' . 

Questa soluzione e preferibile, in funzione della 
latenza dei sommatori e de! comparator!, e delle 
relative dimension! . 

La soluzione rappresentata nella figura 16 
3 0 corrisponde ad ancora un'ulteriore variante in cui 
tutti i possibili confront! vengono effettuati in 
parallel© in un colpo solo utilizzando 1' inf ormazione 
proveniente dall'esplorazione della tabella della 
norma • 
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.iretta^enee Xa parola cXLTrr; • 

num.ro contanuto nella ria. ^ «gres.o con il 

S in.r..so. cosl coJawle^eUlo'rr '^"^ 

nana flgura 14. ° rapprasentato 

In sostanza, partendo Ha 

10 con^lessivamente con l.T \ pa^rT"''""" 
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O (2) = (TH^IiAST (epos) +1) * (2* (N+a) *TH_LAST (C,pos) ) 
/2; 

0(3) ==TH_LAST(C, pos) . 

E' anche possibile evitare di caricare la seconda 
tabella denoininata (TH_LAST) calcolando direttamente i 
valori . 

In particolare e possibile identificare un numero 
di gruppo pari alia norma rappresentata (8, 
nell ' esempio) in cui ciascun gruppo ^ formato dalla 
componente con lo stesso ultimo valore (nell' esempio, 
il gruppo 1 e dalla parola codificata 0 alia parola 
codificata 44/ il secondo dalla parola codificata 45 
alia 80, e cosi via) . 

E' anche possibile notare che all'interno di 
ciascun gruppo c'e un numero di sottovettori (dove 
ciascun sottovettore identificato dal numero nella 
tabella chiamata TH) . In particolare, il primo gruppo e 
formato da 9 sottovettori (pari alia norma +1) , il 
secondo da 8 sottovettori (pari alia norma) e cosi via 
fino all 'ultimo gruppo. 

E' possibile contare tale gruppi dal primo gruppo 
al K-esimo applicando la seguente equazione 

^subblocks^ ^ ((N+l)-grp) = ^N+1 = L,K-1 = k}^ = 

K+l gyp-0 

Dal numero S e anche possibile identificare tanto 
il gruppo quanto il sottovettore e quindi ottenere i 
due valori codificati. 

In particolare d possibile deterrainare a quale 
gruppo appartiene la parola codificata corrente, 
contare quante differenze non negative ci sono fra la 
posizione rivelata indicata con pos (che identifica il 
sottovettore corrente) e il numero di parole codificate 
che appartengono a ciascun gruppo che lo precede. 



In questo caso I'articolazione su due fasi 162, 
168 viene superata. 

Per quanto riguarda 1 ' esplorazione della tabella 
della norma si puo considerare I'esempio di una prima 
tabella TH contenente 16*136 numeri (con una norma 
massima pari a 15) di cui il piu grande d pari a 815v 
(10 bit) con circa meta della tabella riempita da zeri . 
Una tabella di questo genere pud essere ottenuta 
supponendo di visualizzare tutte le possibili parole 
codificate per ciascuna norma possibile in ordine 
crescente. In questo modo si vede che anche le quattro 
parole originali che formano quella codificata sono 
anch'esse ordinate. 

In particolare, d possibile identificare un gruppo 
per ciascun cambiamento del numero di componenti 2 
(partendo da 0} . Nella tabella TH sopra indicata, che d 
essenzialmente una tabella di soglia, si scrive ciascun 
valore di parola codificata che rappresenta I'inizio 
dei gruppi . 

A questo punto risulta pero necessaria la seconda 
tabella, con le stesse dimension! di quella descritta 
in precedenza, che rappresenta il valore reale della 
parola denominata 3 . 

A questo punto, riferendosi alia figura 16, d 
possibile determinare a partire da una certa parola 
codificata, il suo valore originale per parole del tipo 
(0(0:3) ) . 

Questo pud essere fatto nel modo seguente. 

Indicando con C la differenza fra la massima norma 
disponibile e la norma reale N della parola codificata 
e «pos" I'indice nella prima tabella del gruppo dove g 
collocata la parola codificata in ingresso e possibile 
definire le seguenti grandezze. 

0(0)0TH(C,pos+l) -input-1; 

0(l)=input-TH{C,pos) ; 
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di cache, fra il primo ed il secondo livello, cosi da 
mascherare direttamente la sua latenza. 

In alternativa, cosi come rappresentato nella 
figura 18, un decodif icatore secondo 1 invenzione, 
5 indicate con D2 e collocato direttamente al terminale 
di uscita della tnemoria esterna MP. 

Si apprezzera che in ogni caso la soluzione 
secondo I'invenzione consente di superare le 
limitazioni piii rilevanti oggi esistenti in relazione 

10 ai sistemi di tipo embedded ossia costi, 
assorbimento/dissipazione di potenza e ingombro. 

La soluzione secondo I'invenzione consente di 
ridurre 1 ' occupazione di un tale sistema, riducendone 
le esigenze in termini di memoria. La soluzione secondo 

15 I'invenzione consegue altresi una riduzione 
dell' assorbimento/dissipazione di potenza sia per il 
fatto di ridurre le dimensioni e dunque 1' ingombro 
della memoria di programma, sia perche riduce 
I'attivita di coramutazione (SA) del bus di memoria. 

20 Naturalmente, fermo restando il principio 

dell' invenzione, i particolari di realizzazione' e le 
forme di attuazione potranno essere ampiamente variati 
rispetto a quanto descritto ed illustrato, senza per 
questo uscire dall'ambito della presente invenzione, 

25 cosi come definita dalle rivendicazioni annesse. 
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Questo puo essere fatto con la formula che permette di 
calcolare S . 

II numero di gruppo identica 1' ultima parola non 
compressa. Per ottenere la parola numero due si deve 
applicare la formula 

0(2) = grp.il^lZ^ 

Nello schema della figura 16, i riferimenti 164'' 
indicano rispettivi comparatori che effettuano il 
confronto sul valore di TH cosi da selezionare, nel 
passo indicate con 166 la prima riga da sinistra verso 
destra . 

I riferimenti 180 a 188 identificano i passi in 
cui vengono implementate le relazioni citate in 
precedenza. 

15 Infine, le figure 17 e 18 illustrano due possibili 

architetture di sistema processore suscettibile di 
impiegare la soluzione secondo I'invenzione. 

In entrambe le figure d rappresentato un 
processore, indicato come CPU con associate rispettive 
20 cache rispettivamente- di dati D$ e istruzioni 1$. La . 
linea su cui il processore eroga verso la cache 
istruzioni 1$ il program counter PC e indicata con il 
simbolo omologo- 

Si suppone poi che il processore CPU si interfacci 
25 tramite una normale interfaccia CMC con un bus B che 
gli consente di colloquiare con una memoria principale 
MEM con una o piu periferiche PI, P2, Pn con una 

memoria di programma PC. 

Nell'architettura rappresentata nella figura 17, 
30 un decodificatore secondo 1 ' invenzione, indicato con 
DI, tipicamente configurate come un piccolo ASIC, pu6 
essere collocato fra il bus di sistema B (e la cache 
istruzioni 1$) . Questo puo awenire tramite 
collocazione nel cosiddetto memory control unit o, se d 
35 presente la gerarchia di cache con almeno due livelli 
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vettori (GV) con dimensioni pari alia cache di riga del 
processore, per cui ciascun vettore (V) contiene un 
numero di indici (nl) pari al rapporto fra le 
dimensioni di detta riga di cache ed il numero (B) di 
5 vettori contenuti in ciascun gruppo. 

3 . Procedimento secondo la rivendicazione 2 , 
caratterizzato dal fatto che tanto il numero (B) di 
vettori compresi in ciascun gruppo quanto il numero di 
indici (nl) compresi in ciascun vettore sono entrambi 

10 potenza di due, 

4. Procedimento secondo iina qualsiasi delle 
precedenti rivendicazioni, caratterizzato dal fatto che 
comprende I'operazione di suddividere dette parole 
binarie in detto formato non-codif icato in un numero 

15 dato (d) di sotto-parole (ni, n2, nm) , dette sotto- 

parole binarie essendo convertite in detto formato 
codificato ricorrendo a rispettivi vocabolari di 
codif ica, 

5. Procedimento secondo la rivendicazione 4, 
20 caratterizzato dal fatto che comprende I'operazione di 

' ' "suddividere dette parole binarie in due sotto-parol^ 
binarie, corrispondenti rispettivaraente alia parte alta 
ed alia parte bassa della parola binaria nel formato 
non-codif icato . 

25 6. Procedimento secondo una qualsiasi delle 

precedenti rivendicazioni, caratterizzato dal fatto che 
comprende I'operazione di costituire detti vocabolari 
di codifica riservando a parole binarie di bassa 
ricorrenza rispettive sequenze di bit codificate 

3 0 comprendenti un numero di bit suscettibile di risultare 
non inferiore rispetto al numero di bit compresi nella 
corrispondente parola binario in formato non- 
codif icato. 

7. Procedimento secondo una qualsiasi delle 
3 5 precedenti rivendicazioni , caratterizzato dal fatto che 
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RIVENDICAZIONI 
1. Procedimento per convertire parole binarie fra 
un formato non-codif icato (OP) e un format© codificato 
cotnpresso (V), in cui, in detto formato codificato 
compresso, delle parole binarie sono, almeno in parte, 
rappresentate da sequenze di bit codificate piii corte 
della rispettiva parola binaria nel formato non- 
codificato, dette sequenze di bit codificate essendo 
selezionate in .funzio.ne della ricorrenza. statistica 
delle rispettive parole nel formato non-codif icato ed 
in cui alle parole binarie con pia elevata ricorrenza 
sono associate sequenze di bit codificate cotnprendenti 
numeri di bit corrispondentemente piO ridotti, la 
corrispondenza fra parole binarie in formato 'non- 
15 codificato e le sequenze di bit codificate ad esse 
associate essendo stabilita tramite indici di almeno un 
vocabolario di codif ica, caratterizzato dal fatto che 
comprende le operazioni di : 

- ordinare detti indici in una sequenza ordinata, 

2 0 - organizzare detta sequenza di indici in gruppi 
di vet tori (GV) , 

- suddividere ciascun gruppo di vettori in un 
numero dato di vettori (v) , 

ed almeno una fra le operazioni di : 
25 - codificare detti vettori (V) in modo 

indipendente I'uno dall'altro, 

- calcolare e memorizzare (ATT), per ciascun 
gruppo di vettori (GV) , I'indirizzo di partenza del 
blocco compresso, oppure le differenze rispetto 

30 all'ultimo indirizzo complete riportatovi . 

2. Procedimento secondo la rivendicazione 1, 
applicato a parole binarie costituenti le istruzioni di 
un processore avente una cache di riga di dimensions 
data (CACHE_LINE) , caratterizzato dal fatto che 
comprende I'operazione di formare detti gruppi di 
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binaria nel formato non-codif icato, tale operazione di 
shift essendo attuata sino a quando la corrispondente 
norma raggiunge un valore predeterminato. 

13. Procedimento secondo la rivendicazione 12, 
5 caratterizzato dal fatto che detta sequenza di bit 

codificata e organizzata come insieme di campi 
comprendenti : 

- un campo identif icativo del numero di shift 
realizzati (SS) , . . 

10 - 1' identif icazione dei bit sottoposti a shift 

(SB) , 

- il valore di norma risultante (N) , e 

- detta sequenza di bit codificata piu corta (EW) . 

14. Procedimento secondo la rivendicazione 13, 
15 caratterizzato dal fatto che comprende 1' operazione di 

collocare detto campo identif icativo dei bit sottoposti 
a shift (SB) al fondo della sequenza di bit codificata 
piu corta corrispondente. 

15- Procedimento . secondo una qualsiasi delle 
20 precedent! rivendicazioni 9 a 14 , caratterizzato dal 
fatto che cbmprende" le operazibni di: 

- definire un numero (L) di indici successivi 
suscettibili di essere codificati insieme come una 
singola parola codificata, 

25 - costituire una tabella di confront© o look-up 

con dimensioni LxK, dove L d detto valore pari al 
numero delle parole destinate ad essere concatenate 
insieme e K rappresenta la massima norma possibile per 
le parole codificate, determinando quindi la parola 

30 codificata a partire da L successivi indici secondo la 
relazione 

L X 

encoded = ^ ^Ntableii,j] 

dove encoded rappresenta la parola codificata, le 
somraatorie si estendono rispettivamente per i che va da 



- 35 - 



10 



15 



20 



25 



30 



35 



comprende I'operazione di memorizzare detti gruppi di 
vettori (GV) memorizzando, per ciascuno di detti gruppi 
di vettori (GV) , un rispettivo indirizzo di partenza. 

8. Procedimento secondo la rivendicazione l, 
caratterizzato dal fatto che comprende I'operazione di 

prowedere una tabella di traduzione degli indirizzi 
(ATT) per salvare i suddetti indirizzi di partenza di 

detti gruppi di vettori. 

9. Procedimento secondo una qualsiasi delle 
precedent! rivendicazioni, caratterizzato dal fatto che 
comprende I'operazione di determinare, per ciascuno di 
detti vettori (V) , una corrispondente norma data dalla 
somma degli indici contenuti nel vettore stesso. 

10. Procedimento secondo la rivendicazione 9, 
caratterizzato dal fatto che comprende I'operazione di 
sottoporre detta norma ad una codifica di lunghezza 
variabile (VLC) . 

11. Procedimento secondo la rivendicazione 10, 
caratterizzato dal fatto che detta norma vieni 
codificata con una stringa di bit comprendente un campo 
di etichetta o tag ed un campo di bit rappresentativi 
del valore reale della norma, i valori di norma con piii 
elevata ricorrenza essendo rappresentati con campi di 
etichetta e campi di rappresentazione del valore reale 
pia corti rispetto ai campi di etichetta ed ai campi di 
rappresentazione del valore reale riservate ai valori 
di norma con pia ridotta ricorrenza statistica. 

12. Procedimento secondo la rivendicazione 9, 
caratterizzato dal fatto che per convertire dette 
parole binarie da detto formato non-codif icato in detto 
formato codificato si procede attribuendo i bit meno 
significativi di ciascuna parola binaria non-codif icata 
alia corrispondente sequenza di bit codificata 
procedendo ad un insieme di operazioni di divisione per 
due corrispondenti a shift di bit compresi nella parola 
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18. Procedimento secondo la rivendicazione 
rivendicazione 17, caratterizzato dal fatto che 
comprende le operazioni di : 

- leggere detto gruppo codificato di bit ed il 
relative valore di norma, 

- collocarlo nell' ultima riga di detta matrice 
nella colonna identificata dal valore di norma, 

- confrontare il valore letto nella matrice e il 
valore codificato di ingressp, 

- se il valore di ingresso e inferiore rispetto al 
valore letto, sottrarre il valore di ingresso dal 
valore letto e ridurre di uno il valore del la norma 
fino al soddisfacimento del confronto, e 

- se il valore di ingresso e maggiore rispetto al 
valore letto la differenza fra la norma di partenza e 
quella effettiva ^ 1' ultimo degli indici codificati, ed 
il .process© viene riawiato dalla riga successiva in 
corrispondenza della colonna dove il precedente 
confronto non e stato soddisfatto. ; 

19. Procedimento secondo la rivendicazione 17 o la 
rivendicazione 18 , caratterizzato dal fatto che 
comprende le operazioni di : 

- confrontare direttamente la parola codificata di 
ingresso con il numero contenuto nella riga indicata 
dalla norma di ingresso, 

- calcolare I'indice risultante da utilizzare per 
la decodifica, sulla base della posizione vincente 
nell'ambito della tabella cosi identificata. 

20. Procedimento secondo la rivendicazione 19, 
caratterizzato dal fatto che, per ottenere gli indici 
da utilizzare la codifica, si precede ricavando 
1' ultimo indice come pari alia differenza fra la parte 
rimanente della norma ed il valore dell ' ingresso • dopo 
tutte le sottrazioni effettuate sugli stessi, ricavando 
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1 a L e per j che va da 1 a Xi e Ntable[i,j] 
rappresenta I'insieme dei punti a coordinata intera che 
identificano una piramide ad i dimensioni con norma j, 
detta norma esprimendo la somma dei valori assoluti 
5 delle coordinate dei punti che la compongono. 

16. Procedimento secondo una qualsiasi delle 
precedenti rivendicazioni, caratterizzato dal fatto che 
dette sequenze di bit codificate mappano al loro 
interno un indirizzo identif icativo della 
10 corrispondente parola binaria in formato non- 
codif icato, per cui ciascuna di dette sequenze di bit 
codificate d suscettibile di essere convertita nella 
corrispondente parola binaria in formato non-codif icato 
in modo indipendente da altre sequenze di bit 
15 codificate. 

17. Procedimento secondo una qualsiasi della 
rivendicazioni 12 a 16, caratterizzato dal fatto che, " 
per convertire una determinata parola binaria da detto 
formato codif icato in detto formato non-codif icato, 
20 comprende le operazioni di: 

- identif icare il corrispondente gruppo di vettori 
(GV) nel formato codificato, 

- leggere, a partire da detto gruppo di vettori, 
detto campo identif icativo di quant i shift sono stati ' 

25 realizzati (ss) , 

leggere 1 ' informazione relativa ai bit 
sottoposti a shift (SB), 

- leggere 1 ' informazione relativa a detta norma 

(N) , 

30 - leggere 1 ' informazione relativa a detto blocco 

di informazione codificato (EW) , e 

- costruire detta parola binaria in detto formato 
non-codif icato a partire dall ' informazione letta (SS 
SB, N, EW) . 



1 a 21, detto modulo convertitore (Dl, D2) e collocato 
in almeno una posizione intermedia fra: 

- una di dette memorie cache (IS$) e detto bus 

(B) , e 

- detto bus (B) ed almeno una di dette memorie 

(MP) . 

23. Sistema second© la rivendicazione 22, 
caratterizzato dal fatto che detto almeno un modulo 
convertitore (Dl) risulta interposto fra la cache 
istruzioni (1$) e detta interfaccia di bus (B) . 

24 . Sistema secondo la rivendicazione 22 o la 
rivendicazione 23, caratterizzato dal fatto che detto 
almeno un modulo convertitore (D2) S interposto fra 
detto bus (B) ed una memoria di programma (MP) 
associata a detto processore. 

25. Sistema secondo la rivendicazione 22, 
caratterizzato dal fatto che detta almeno una memoria 
cache (1$) ^ una cache organizzata su due livelli e dal 
fatto che detto modulo convertitore (Dl) ^ interposto 
fra detti due livelli di livelli di cache. 

26. Prodotto infoirmatico direttamente caricabi^e 

nella memoria di un processore digitale e comprendente 
porzioni di codice software suscettibili di attuare il 
procedimento secondo una qualsiasi delle rivendicazioni 
1 a 18 quando ^ eseguito su detto processore digitale. 



- 39 - 



15 



invece il penultimo indice come valore di ingresso 
residue . 

21. Procedimento secondo la rivendicazione 17, 
caratterizzato dal fatto che le operazioni di : 
5 - formare una tabella (TH) che raccoglie tutte le 

parole codificate possibili per detto valore di norma 
in ordine crescente, per cui anche le parole original! 
che formano la parola codificata risultano ordinate fra 
loro, 

- determinare, a partire da una certa parola 
codificata, la corrispondente parola binaria in formate 
non-codificato sulla base della differenza (C) fra la 
massima norma disponibile e la norma reale (N) della 
parola codificata, definendo un indice ("pos") nella 
prima tabella del gruppo dove la parola di ingresso e 
collocata, 

- determinare quale gruppo appartiene la parola 
codificata corrente conteggiando quante differenze non- 
negative esistono per la posizione identificata da 
detto indice, che identifica il sotto-vettore corrente, 
ed il numero di parole . codificate che appartengono a 
ciascun gruppo precedente. 

22. Sistema processore comprendente un'unita 
elaborativa (CPU), rispettive memorie cache (l$, d$) , 
detta unita elaborativa (CPU) essendo configurate per 
poter dialogare tramite un bus (B) con almeno una 
memoria (MEM, MP) ed almeno un'unita periferica (PI,. 
P2, Pn) , a detta unita elaborativa (CPU) essendo 

associata una corrispondente inter faccia di bus (CMC) , 
30 il sistema essendo caratterizzato dal fatto che 
comprende almeno un modulo convert i tore (DI, D2) 
suscettibile di convert ire parole binarie fra un 
formato non-codificato ed un formato codificate con il 
procedimento secondo una qualsiasi delle rivendicazioni 
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RIASSUNTO 

Parole binarie sono convertite fra un formate non- 
codif icato (OP) e un formato codif icato compresso (V) , 
in cui le parole binarie sono, almeno in parte, 
5 rappresentate da sequenze di bit codificate piil corte 
del la rispettiva parola binaria nel formato non 
codif icato. Le sequenze di bit codificate piu corte 
sono selezionate in funzione del la ricorrenza 
statistica delle rispettive parole nel formato non- 
10 codificate ed alle parole binarie con piu elevata 
ricorrenza sono associate sequenze di bit codificate 
comprendenti numeri di bit corrispondentemente pia 
ridotte. La corrispondenza fra parole binarie in 
formato non-codif icato e le sequenze di bit codificate 
15 ad esse associate d stabilita tramite indici di un 
vocabolario di codif ica. II procedimento di conversione 
- comprende le operazioni di : 

- ordinare gli indici in una sequenza ordinata, 

- organizzare la sequenza di indici in gruppi di 
20 vettori (GV) , 

- suddividere ciascun gruppo di vettori in un 
numero dato di vettori (V) , e 

- codificare i vettori (V) in modo indipendente 
I'uno dall'altro. 

25 Alternativamente, per ciascun gruppo di vettori, 

alia fine del process© di codifica si calcola e si 
salva in una tabella, chiamata tabella di traduzione • 
degli indirizzi (ATT), I'indirizzo di partenza su 32 
bit del blocco compresso, oppure le differenze, 

30 espresse in byte, rispetto all'ultimo indirizzo 
complete riportatovi. 
(Figura 2) 
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